Apresentação

A pandemia da covid-19 iniciada no ano de 2020 impactou na vida de todos ao redor do planeta em questões relacionadas a conviência, trabalho, saúde e até nos comportamentos das pessoas. Em relação aos comportamentos, tivemos que ficar confinados em nossas residências como uma forma de proteção ao contágio pelo vírus da covid-19. Porém, seria interessante analisar o comportamento de casos de estupros para ver se eles foram influenciados por este contexto de isolamento no estado do Pará.

A resposta para qualquer tipo de questionamento deve ser com base em dados. Para este trabalho, vamos usar os dados presentes na página do Portal da Transparência da Secretaria de Segurança Pública e Defesa Social do Pará - SEGUP/PA (http://sistemas.segup.pa.gov.br/transparencia/). Nela, é possível obter dados sobre questôes relacionadas ao número de casos de homicídios, latrocínios, estupros etc registrados em todos os municípios do estado.

A base

O portal fornece dados coletados entre todos os mêses dos anos de 2010 até 2021 (considerando que estamos em 2022), sendo eles estruturados em:

Os valores numéricos correspondem a quantidade total de casos por mês para cada município do estado.

Os dados

Os dados foram extraídos da página usando técnica de Webscraping por meio da biblioteca rverst. Após isso, foram salvos em dois arquivos em formato csv para que os dados possam ser usados sem ter que extraí-los novamente da página. Neste caso, vamos usar dados de 2020 e 2021.

Nome dos arquivos:

  • ocorrencia de estupros - pa 2020.csv
  • ocorrencia de estupros - pa 2021.csv

Acessando os dados

Vamos carregar os dados fazendo a leitura dos arquivos .csv

dados_2020 <- read.csv("Data/ocorrencia de estupros - pa 2020.csv")
dados_2021 <- read.csv("Data/ocorrencia de estupros - pa 2021.csv")


Ocorrências de estupros no ano de 2020:



Ocorrências de estupros no ano de 2021:


Ajustando as bases

A primeira coisa que vamos fazer é remover a coluna X das duas bases, pois ela não tem utilidade para a nossa análise. Além disso, a nossa base de dados relacionada ao ano de 2020 possui um problema de padronização de nome para o mês de julho. Todas as demais colunas estão com o padrão de 3 letras (JAN, FEV etc), porém a coluna para o mês de julho está como JULHO. Também falta padronizar o nome da coluna MUNICIPIO, pois, em relação a base de 2021, o ideal seria ela estar como MUNICIPIOS. Por fim, existem algumas diferenças entre os nomes de alguns municípios entre as tabelas de 2020 e 2021.

#Removendo as colunas X
dados_2020$X <- NULL
dados_2021$X <- NULL

#Renomeando as colunas 1 e 9
names(dados_2020)[1] <- "MUNICIPIOS"
names(dados_2020)[9] <- "JUL"

#Padronizando os nomes de alguns municipios do ano de 2021
dados_2021$MUNICIPIOS <- str_replace_all(dados_2021$MUNICIPIOS, 
                                         c("-" = " ", "D "= "D'"))

Outro processo que iremos realizar será transformar a nossa tabela de formato wide para formato longer. Aplicando isso, teremos uma tabela em que os mêses não serão mais vistos como colunas e sim dados em uma coluna chamada de MESES.Além disso, a quantidade o ocorrências para cada mês será um dado em uma coluna na nova tabela.

#Base em formato longer
dados_long_2020 <- dados_2020 %>%
  pivot_longer(-c(MUNICIPIOS, RISP), 
               names_to = 'MESES', 
               values_to = "Num Ocorrencias") %>%
  arrange(RISP)

dados_long_2021 <- dados_2021 %>%
  pivot_longer(-c(MUNICIPIOS, RISP),
               names_to = 'MESES', 
               values_to = "Num Ocorrencias") %>%
  arrange(RISP)

head(dados_long_2021)
## # A tibble: 6 x 4
##   MUNICIPIOS RISP   MESES `Num Ocorrencias`
##   <chr>      <chr>  <chr>             <int>
## 1 BELEM      01RISP JAN                  53
## 2 BELEM      01RISP FEV                  33
## 3 BELEM      01RISP MAR                  31
## 4 BELEM      01RISP ABR                  43
## 5 BELEM      01RISP MAI                  55
## 6 BELEM      01RISP JUN                  50

Explorando os dados

Podemos iniciar a análise visualizando o total de ocorrências para cada mês e comparar com os anos de 2020 e 2021. Para isso, é necessário agrupar os dados por meses.

#Vetor usado para ordenar os dados no eixo x
ord_mts <- c("JAN", "FEV", "MAR", "ABR", "MAI", "JUN", "JUL", "AGO", "SET", "OUT", "NOV", "DEZ")

#Agrupando por meses, somando todos os casos e salvando em uma coluna
casos_meses_2020 <- dados_long_2020 %>%
  group_by(MESES) %>%
  summarise(`OCORRENCIAS 2020` = sum(`Num Ocorrencias`)) %>%
  arrange(factor(MESES, levels = ord_mts)) %>%
  ungroup() 

casos_meses_2021 <- dados_long_2021 %>%
  group_by(MESES) %>%
  summarise(`OCORRENCIAS 2021` = sum(`Num Ocorrencias`)) %>%
  arrange(factor(MESES, levels = ord_mts)) %>%
  ungroup()

#Unindo as duas tabelas pela variável MESES
jt_meses <- left_join(casos_meses_2020, casos_meses_2021, by = "MESES")
jt_meses
## # A tibble: 12 x 3
##    MESES `OCORRENCIAS 2020` `OCORRENCIAS 2021`
##    <chr>              <int>              <int>
##  1 JAN                  280                265
##  2 FEV                  299                243
##  3 MAR                  235                316
##  4 ABR                  183                296
##  5 MAI                  200                323
##  6 JUN                  274                312
##  7 JUL                  291                352
##  8 AGO                  320                378
##  9 SET                  321                343
## 10 OUT                  317                334
## 11 NOV                  324                318
## 12 DEZ                  254                225

Vamos ter que remodelar a tabela jt_meses para que o ggplot possa diferenciar dados que são referentes ao ano de 2020 e de 2021. Vamos transformar os nomes das nossas colunas OCORRENCIAS 2020 e OCORRÊNCIAS 2021 em dados de uma coluna nova coluna, fazendo a relação dela com a quantidade de casos para cada mês.

resh_dados_meses <- reshape2::melt(jt_meses, id.vars = "MESES")

Agora podemo gerar um gráfico de colunas comparando os casos de 2020 e 2021 para cada mês do ano. O resultado do gráfico deixa claro que o isolamento forçado devido ao aumento significativo no número de casos de pessoas infectadas com o vírus da covid-19 forçou as pessoas a ficarem em casa, porém não significou que os casos foram reduzidos drásticamentes, pois muitos casos devem ter sido relatados dentro da própria residência pelo companheiro.

É interessante destacar o grande aumento de casos no ano de 2021 quando comparado com o ano anterior. Essa percepção fica bem clara quando analisamos os meses de março, abril, maio e junho conforme o gráfico abaixo.

Podemos também analisar o total de casos considerando cada RISP. Para isso, precisamos criar novas tabelas de dados por meio de agrupamentos por RISPs. Então, podemos gerar um gráfico interativo que relaciona o número de casos totais para cada RISPs ao longo dos anos de 2020 e 2021.

Podemos ver que algumas RISPs se destacam em relação a outras, isso devido ao fato de elas terem dentro da sua região de abrangência municípios relevantes principalmente quando se considera a quantidade de habitantes.

Uma outra análise que podemos fazer é verificar o total de casos em 2020 e 2021 para todos os municipios do estado. Então, podemos começar nossa análise verificando a porcentagem de aumento ou diminuição de casos em todos os municípios.

A tabela abaixo apresenta bem as variações de casos entre os municípios. Alguns municípios tiveram aumentos significativos como no caso de Oéiras do Pará que teve um aumento de 153% no número de casos registrados, passando de 13 casos em 2020 para 33 em 2021. Existem também os municípios que tiveram reduções consideráveis como o municípios de Curionópolis que reduziu em 79% indo de 24 casos em 2020 para 5 em 2021.

MUNICIPIOS 2020 2021 COMPARATIVO VARIACAO %
ABAETETUBA 66 72 6 9.09
ABEL FIGUEIREDO 1 4 3 300
ACARA 39 38 -1 -2.56
AFUA 8 7 -1 -12.5
AGUA AZUL DO NORTE 5 8 3 60
ALENQUER 23 15 -8 -34.78
ALMEIRIM 20 28 8 40
ALTAMIRA 52 63 11 21.15
ANAJAS 5 5 0 0
ANANINDEUA 175 191 16 9.14
ANAPU 14 13 -1 -7.14
AUGUSTO CORREA 17 19 2 11.76
AURORA DO PARA 19 16 -3 -15.79
AVEIRO 6 6 0 0
BAGRE 6 18 12 200
BAIAO 5 13 8 160
BANNACH 0 0 0 0
BARCARENA 81 79 -2 -2.47
BELEM 491 593 102 20.77
BELTERRA 15 18 3 20
BENEVIDES 48 31 -17 -35.42
BOM JESUS DO TOCANTINS 12 7 -5 -41.67
BONITO 2 11 9 450
BRAGANCA 41 52 11 26.83
BRASIL NOVO 11 16 5 45.45
BREJO GRANDE DO ARAGUAIA 11 4 -7 -63.64
BREU BRANCO 23 17 -6 -26.09
BREVES 26 27 1 3.85
BUJARU 12 15 3 25
CACHOEIRA DO ARARI 21 18 -3 -14.29
CACHOEIRA DO PIRIA 9 11 2 22.22
CAMETA 34 40 6 17.65
CANAA DOS CARAJAS 27 43 16 59.26
CAPANEMA 21 26 5 23.81
CAPITAO POCO 17 22 5 29.41
CASTANHAL 65 123 58 89.23
CHAVES 8 12 4 50
COLARES 9 7 -2 -22.22
CONCEICAO DO ARAGUAIA 12 25 13 108.33
CONCORDIA DO PARA 18 12 -6 -33.33
CUMARU DO NORTE 1 3 2 200
CURIONOPOLIS 24 5 -19 -79.17
CURRALINHO 13 19 6 46.15
CURUA 2 3 1 50
CURUCA 23 17 -6 -26.09
DOM ELISEU 10 16 6 60
ELDORADO DOS CARAJAS 11 23 12 109.09
FARO 0 6 6 0
FLORESTA DO ARAGUAIA 3 18 15 500
GARRAFAO DO NORTE 6 8 2 33.33
GOIANESIA DO PARA 32 22 -10 -31.25
GURUPA 8 8 0 0
IGARAPE ACU 17 19 2 11.76
IGARAPE MIRI 30 21 -9 -30
INHANGAPI 4 7 3 75
IPIXUNA DO PARA 27 15 -12 -44.44
IRITUIA 21 18 -3 -14.29
ITAITUBA 50 54 4 8
ITUPIRANGA 27 21 -6 -22.22
JACAREACANGA 3 8 5 166.67
JACUNDA 15 24 9 60
JURUTI 32 26 -6 -18.75
LIMOEIRO DO AJURU 5 11 6 120
MAE DO RIO 11 8 -3 -27.27
MAGALHAES BARATA 6 5 -1 -16.67
MARABA 61 102 41 67.21
MARACANA 19 12 -7 -36.84
MARAPANIM 17 18 1 5.88
MARITUBA 50 44 -6 -12
MEDICILANDIA 11 12 1 9.09
MELGACO 6 3 -3 -50
MOCAJUBA 12 10 -2 -16.67
MOJU 72 47 -25 -34.72
MOJUI DOS CAMPOS 6 10 4 66.67
MONTE ALEGRE 23 12 -11 -47.83
MUANA 10 11 1 10
NOVA ESPERANCA DO PIRIA 6 8 2 33.33
NOVA IPIXUNA 2 4 2 100
NOVA TIMBOTEUA 4 3 -1 -25
NOVO PROGRESSO 13 21 8 61.54
NOVO REPARTIMENTO 21 15 -6 -28.57
OBIDOS 29 15 -14 -48.28
OEIRAS DO PARA 13 33 20 153.85
ORIXIMINA 38 11 -27 -71.05
OUREM 6 9 3 50
OURILANDIA DO NORTE 19 14 -5 -26.32
PACAJA 13 14 1 7.69
PALESTINA DO PARA 7 5 -2 -28.57
PARAGOMINAS 34 53 19 55.88
PARAUAPEBAS 120 136 16 13.33
PAU D’ARCO 4 5 1 25
PEIXE BOI 2 1 -1 -50
PICARRA 6 2 -4 -66.67
PLACAS 12 10 -2 -16.67
PONTA DE PEDRAS 15 25 10 66.67
PORTEL 14 31 17 121.43
PORTO DE MOZ 14 27 13 92.86
PRAINHA 6 6 0 0
PRIMAVERA 4 7 3 75
QUATIPURU 4 4 0 0
REDENCAO 21 22 1 4.76
RIO MARIA 11 10 -1 -9.09
RONDON DO PARA 11 26 15 136.36
RUROPOLIS 19 12 -7 -36.84
SALINOPOLIS 23 34 11 47.83
SALVATERRA 17 24 7 41.18
SANTA BARBARA DO PARA 12 16 4 33.33
SANTA CRUZ DO ARARI 6 3 -3 -50
SANTA IZABEL DO PARA 32 31 -1 -3.12
SANTA LUZIA DO PARA 10 9 -1 -10
SANTA MARIA DAS BARREIRAS 3 9 6 200
SANTA MARIA DO PARA 10 6 -4 -40
SANTANA DO ARAGUAIA 15 30 15 100
SANTAREM 138 148 10 7.25
SANTAREM NOVO 6 4 -2 -33.33
SANTO ANTONIO DO TAUA 19 16 -3 -15.79
SAO CAETANO DE ODIVELAS 13 13 0 0
SAO DOMINGOS DO ARAGUAIA 13 3 -10 -76.92
SAO DOMINGOS DO CAPIM 11 15 4 36.36
SAO FELIX DO XINGU 29 20 -9 -31.03
SAO FRANCISCO DO PARA 8 4 -4 -50
SAO GERALDO DO ARAGUAIA 10 7 -3 -30
SAO JOAO DA PONTA 3 3 0 0
SAO JOAO DE PIRABAS 11 7 -4 -36.36
SAO JOAO DO ARAGUAIA 11 12 1 9.09
SAO MIGUEL DO GUAMA 20 33 13 65
SAO SEBASTIAO DA BOA VISTA 8 10 2 25
SAPUCAIA 0 1 1 0
SENADOR JOSE PORFIRIO 13 8 -5 -38.46
SOURE 35 20 -15 -42.86
TAILANDIA 28 36 8 28.57
TERRA ALTA 5 3 -2 -40
TERRA SANTA 4 13 9 225
TOME ACU 33 42 9 27.27
TRACUATEUA 8 19 11 137.5
TRAIRAO 5 14 9 180
TUCUMA 4 13 9 225
TUCURUI 35 50 15 42.86
ULIANOPOLIS 7 14 7 100
URUARA 26 23 -3 -11.54
VIGIA 22 27 5 22.73
VISEU 16 15 -1 -6.25
VITORIA DO XINGU 5 11 6 120
XINGUARA 13 19 6 46.15

Também podemos tentar ver o comportamento dos casos filtrando apenas os municípios com os maiores números de casos ao longo dos anos em cada RISP. Para isso, precisamos gerar novas tabelas. Então, vamos criar tabelas para o total deo ocorrências por cada município e depois filtrar os municípios que tiveram as maiores ocorrências ao longo dos anos de 2020 e 2021.

É importante destacar que alguns municípios tiveram aumentos significativos como no caso de Castanhal que em 2020 registrou 65 casos de estupros, mas em 2021 esse número aumentou para 123 casos.

Além disso, podemos ver na tabela que ocorreram algumas trocas de posições entre municípios em determinadas RISPs, conforme destacado na tabela abaixo. A RISP 05 é um exemplo do ocorrido, pois em 2020 tinhamos Soure como destaque por ter contabilizado o maior número de ocorrências registradas entre os demais municípios pertencentes ao RISP 05, já em 2021 tivemos Ponta de Pedras como sendo o destaque na mesma RISP.

Conclusão

Este trabalho meramente descritivo e com objetivos acadêmicos teve como objetivo realizar um estudo simples sobre o comportamento dos casos de estupros no ano de 2020, ano este em que tivemos uma mudança de comportamento mundial devido a pandemia do novo corona vírus. Também fizemos uma comparação com os casos no ano posterior (2021). Os resultados deixaram claros que houve uma queda significativa nos primeiros meses de 2020 assim que foi declarado o isolamento social. Entretanto, os casos voltaram a aumentar entre os meses de junho a dezembro. Em relação ao ano de 2021, ficou claro que os casos aumentaram significativamente ao longo de todo o ano muito pelo fato dos relaxamentos das medidas de restrição social. É importante destacar que o mesmo não foi validado por um especialista, portanto os argumentos presentes podem ser superficiais, contudo as realizações são pertinentes. Trabalhos futuros podem realizar comparações com dados do ano de 2019 para informar o comportamento antes, durante e após o ano de início da pandemia. Os dados compartilhados também permitem realizar diversas outras análises e gráficos.